خلاصه سازی اخبار با یک روش ترکیبی خوشه بندی - ژنتیکی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر
- نویسنده جاوید ابراهیمی
- استاد راهنما محمد صنیعی آباده سعید جلیلی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
با گسترش روز افزودن داده های متنی ، بدست آوردن اطلاعات مورد نظر مسئله اساسی در عصر اینترنت است. برای تطبیق با این مسئله فناوریهای جدید که قادر به پردازش داده های حجیم بصورت موثر هستند مورد نیاز است. خلاصه سازهای خودکار یکی از ابزارهای مهم در این راستاست که در حوزه های گوناگون مثل اسناد پزشکی ، مقالات علمی و آرشیو اخبار مورد استفاده قرار می گیرد. این پایان نامه به خلاصه سازی چند سندی در زبان انگلیسی می پردازد که در آن مجموعه ای از اخبار بهم مرتبط به عنوان ورودی دریافت می شود و تعدادی جمله به صورت فشرده به عنوان خروجی تحویل داده می شود.. در حالیکه اغلب رویکردهای موجود ، جملات را انتخاب کرده و سپس افزونگی را بصورت حریصانه حذف می کنند، اخیرا رویکردهای مبتنی بر بهینه سازی در تعیین کیفیت خلاصه بصورت کلی و بهره گیری از ویژگیهای جمعی جملات موثر واقع شده اند. در برخی از این روشها ، خلاصه سازی به یک مسئله بهینه سازی p-median تبدیل می شود. ما نشان میدهیم که این تقریب نادقیق است و برای رفع مشکل آن یک تابع بهینه سازی فازی جدید معرفی می کنیم که از اطلاعات موجود در خوشه های جملات مرتبط یا همان موضوعات ، استفاده می کند. برای این مقصود یک الگوریتم خوشه بندی مبتنی بر گراف معرفی می شود که خروجی آن یک ماتریس عضویت فازی است که میزان تعلق هر جمله به موضوعات درمتن را مشخص می نماید. برای بهینه سازی تابع هدف از یک الگوریتم ژنتیکی استفاده شده است که به کمک عملگرهای هوشمند بهبود یافته است و برای ارزیابی کار از مجموعه داده های duc2001 و duc2004 استفاده شده است. رویکرد ما در معیار rouge-1 بر روی این داده ها به ترتیب به دقت 0.36389 و 0.39826 می رسد.
منابع مشابه
یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر
The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...
متن کاملتحلیل تغییرات ساختاری بخشهای مشتریان با روش ترکیبی خوشه-بندی و قوانین انجمنی
بخشبندی مشتریان یکی از مباحث اصلی و کلیدی در مطالعات مدیریت ارتباط با مشتری محسوب میشود. یکی از چالشهای مهم در بخشبندی مشتریان، ناپایداری و تغییرات بخشهای مشتریان در طول زمان است. تغییرات بخشها را میتوان در دو دستة تغییرات محتوایی و ساختاری دستهبندی کرد. این پژوهش بر تغییرات ساختاری بخشها که اهمیت زیادی دارد، تمرکز کرده است. بهمنظور تحلیل تغییرات ساختاری بخشها و توصیف چگونگی این تغیی...
متن کاملارزیابی، رتبه بندی و خوشه بندی ریسک عملیات تونل سازی سد و نیروگاه سیمره با استفاده از روش ELECTRE
ارزیابی ریسک یکی از مراحل مهم مدیریت پروژه بوده و با توجه به ماهیت نامطمئن پروژههای تونلسازی و لزوم صرف بهینه منابع، اهمیت زیادی دارد. ارزیابی، رتبهبندی و خوشهبندی ریسک، برتری هر ریسک را بر اساس شاخصهای مرتبط مشخص کرده و در نتیجه امکان ارائه پاسخ مناسب برای هر ریسک فراهم میگردد. در این تحقیق ضمن شناسایی و تعیین معیارهای اندازه گیری ریسکهای عملیات تونلسازی سد سیمره، اهمیت نسبی هر ریسک با...
متن کاملتحلیل فراوانی منطقه ای سیلاب با استفاده از روش خوشه بندی ترکیبی نگاشت ویژگی خود سامان و فازی
یکی از روشهای تخمین چندکهای سیلاب در حوضههای فاقد آمار یا با طول دوره آماری کوتاه، استفاده از روش تحلیل فراوانی منطقهای است. در مطالعات منطقهای، به منظور دستیابی به مناطق همگن هیدرولوژیک از تکنیکهای خوشهبندی استفاده میشود. اخیراً در چند تحقیق از نگاشت ویژگی خود سامان(Self-Organizing Feature Maps) استفاده شده است. اما مشکل اصلی SOFM تفسیر نقشه خروجی از این روش بهمنظور یافتن مناطق همگن ه...
متن کاملقطعه بندی تصاویر با استفاده از روش خوشه بندی طیفی مبتنی بر سوپرپیکسل
علم بینایی ماشین یکی از علومی است که در راستای افزایش کارایی حس بینایی در سیستمهای هوشمند به کار گرفته میشود. اولین گام در بسیاری از کاربردهای بینایی ماشین، قطعهبندی تصویر میباشد. در این پژوهش، روش خوشهبندی طیفی با سوپرپیکسل برای قطعهبندی تصویر ارائه شده است. با اعمال الگوریتم KFCM و با استفاده از توزیع عضویت در ماتریس بخشبندی، یک میزان تشابه فازی هستهای جدید پیشنهاد دادهایم که سبب کا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023